Centro de Estadística y Cálculo, Facultad de Agronomía. USAC 


II FORO DE ESTADISTICA 
I CONGRESO NACIONAL DE ESTADISTICA 
I MEETING OF THE INTERNATIONAL BIOMETRIC 
SOCIETY, GUATEMALA GROUP 



MINICURSO 

ANALISIS DE EXPERIMENTOS 
CON EL SISTEMA SAS 


M.Sc. VICTOR MANUEL ALVAREZ CAJAS 
Ing. Agr. BYRON HUMBERTO GONZÁLEZ RAMÍREZ 


Análisis de Experimentos con el Sistema SAS 






Centro de Estadística y Calculo, Facultad de Agronomía. USAC 


1 


ANALISIS DE EXPERIMENTOS CON EL SISTEMA SAS 
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Profesor Titular, Centro de Estadística y Cálculo. Facultad de Agronomía 


Ing. Agr. Byron Humberto González Ramírez 
Administrador de Red, Centro de Estadística y Cálculo. Facultad de Agronomía 


I. PRESENTACION 


Partiendo del marco conceptual de lo que encierra el método científico podemos 
establecer el papel que juega la Estadística en el análisis y la interpretación de los resultados de 
experimentos. 


El análisis y la interpretación objetiva de los resultados de un experimento puede 
considerarse tan importante como la conducción del mismo, y muchas veces esta parte es 
descuidada provocando una pérdida de recursos involucrados en la experimentación agrícola. 


En atención a las premisas anteriores, las presentes notas pretenden dar lincamientos 
generales que permitan facilitar la elección de un diseño experimental que se ajuste más a las 
condiciones reales en que se requiere realizar el experimento, y además, sugerir la forma de cómo 
analizar tanto manual como electrónicamente los resultados que se obtengan. 


El presente trabajo pretende cubrir los siguientes objetivos: 


1. Que las presentes notas sean una ayuda complementaria a las personas que se 
relacionan con la experimentación agrícola. 

2. Facilitar la elección de un diseño experimental en particular de acuerdo a las 
condiciones reales de campo. 

3. Señalar la forma de ordenar los datos de campo y cómo realizar el análisis estadístico 
correspondiente. 

4. Ilustrar la manera de aplicar métodos de análisis univariados a conjuntos de datos a 
través del Sistema -SAS-. 
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1. DISEÑO COMPLETAMENTE AL AZAR -DCA- 

1.1 Características del Diseño. 

La principal, es que los tratamientos se asignan a las unidades experimentales 
aleatoriamente (al azar) sin ninguna restricción. Su uso es muy frecuente cuando el experimento 
se llevará a cabo bajo condiciones homogéneas de humedad, temperatura, luz, suelo, fertilidad, 
entre otras. 


1.2 Ventajas 

a. Su análisis estadístico es fácil 

b. Permite máxima flexibilidad en cuanto al número de tratamientos y número de 
repeticiones. 

c. El análisis estadístico sigue siendo fácil aunque haya una pérdida de unidades 
experimentales. 

d. El número de grados de libertad para el error es máximo en comparación con otros 
diseños. 


1.3 Desventajas 

a. Cuando el número de unidades experimentales es muy grande es difícil encontrar 
lugares grandes que presenten la homogeneidad requerida. 

b. Generalmente otro diseño suele ser más eficiente (preciso). 

1.4 Aleatorización 

Por aleatorización se entiende la asignación al azar de los tratamientos a las unidades 
experimentales usando ya sea una tabla de números aleatorios, o una calculadora científica que 
posea la función RAN #. 


Procedimiento 


a. Determinar el número de unidades experimentales (n) y numerarlas. Es posible 
obtener n al multiplicar el número de tratamientos por el número de repeticiones. 
( n = t x r ). 
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b. Asignar el número de unidades experimentales a cada tratamiento usando la tabla 
de números aleatorios o bien cualquier otro herramienta que sirva a este propósito. 
Ejemplo: Si cada tratamiento se repite cuatro veces; los 4 primeros números 
aleatorios obtenidos se asignan al tratamiento A; los siguientes cuatro números 
aleatorios al tratamiento B; y así sucesivamente. 

c. Una vez hecha la distribución anterior (b), se numeran las unidades experimentales 
y se localizan los tratamientos de acuerdo al número que les corresponde y se 
obtiene así la distribución de campo, (croquis de campo). 


1.5 Modelo Estadístico 


Yij - P + Ti + Eij i — 1,2,. . . t 
j = 1,2, . . . r 

de donde, 

Y¡j= Variable de respuesta de la ij-ésima unidad experimental 
p = Efecto de la media general 
T¡ = Efecto del i - ésimo tratamiento 

E¡j = Efecto del error experimental asociado a la ij-ésima unidad 
experimental 


1.6 Análisis de Varianza 
1.6.1 Hipótesis 

Ho: T = T¡ (Todos los tratamientos producen el mismo efecto) 

Ha: T ^ T¡ para al menos un i; i = 1,2, ... t. (Al menos uno de los tratamientos produce 

efectos distintos) 
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1.6.2 Tabla de Datos 


Repeticiones 


Tratamientos _ Yj. 



1 

2 

3 


r 


1 

Y n 

y 12 

y 13 


Y lr 

Y,. 

2 

y 21 

y 22 

y 23 


Y 2r 

y 2 . 

3 

Y 31 

y 32 

y 33 


Y 3r 

y 3 . 

t 

Y tl 

Y e 

Yo 


Ylr 

Y,. 


1.6.3 Supuestos: 


Las suposiciones que validan el análisis de varianza son: 


a. Los errores son independientes 

b. Los errores están normalmente distribuidos con media cero y varianza constante 

c. Existe homogeneidad de varianzas entre los tratamientos 
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1.6.4 Tabla de Análisis de Varianza 


Fuentes de 

variación 

Grados de 
libertad (gl) 

Suma de 

Cuadrados 

C. Medios 

Fe 

Tratamientos 

t-1 

y Y ¡ 1 2 Y 2 

m r tr 

SCtrat / §1 trat 

CM trat / CM ee 

Error 

t(r-l) 

SCtotal - Sctrat 

SCee / §1 ee 


Total 

tr- 1 

« . L 

1 




Regla de Decisión 

Rechazar Ho. si Fe > Ft (gi trat; gl error; a) 

No Rechazar Ho. si Fe < Ft (gl trat; gl error; a) 


Ft = Valor tabular que puede ser encontrado en la tabla 1 del anexo, considerando 
gl trat y gl error. 

1.6.5 Coeficiente de Variación (CV) 

Se le puede considerar como medida relativa de la variación que no es posible 
controlar en el experimento (error experimental) y se calcula de la siguiente forma: 


CV = 



*100 


Y 



Y 

tr 


1.7 Ejemplo de Aplicación 

Se probaron concentraciones de 1, 2, 3 y 4 ppm de una cierta enzima mas un control (en 
que no se añadió enzima) para estudiar su efecto en la separación de un jugo de naranja. Cada 
tratamiento se replicó 4 veces y se usó un diseño completamente al azar. Se añadió agua a las 20 
muestras y se midió el tiempo de separación (minutos) en cada muestra. Los resultados pueden 
observarse en el cuadro 1. Interesa responder a las siguientes preguntas: 

1. La presencia de enzima retarda la separación comparada con la ausencia de la misma? 

2. Hay algún efecto diferencial del nivel de enzima agregado? 
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Cuadro 1: Resultados en minutos, del tiempo de separación de un jugo de naranja luego de la 
aplicación de una enzima. 


Tratamiento 

Minutos 

0 

3.96 

0 

6.24 

0 

5.42 

0 

11.11 

1 

27.31 

1 

26.96 

1 

32.21 

1 

30.13 

2 

35.3 

2 

34.71 

2 

36.75 

2 

38.38 

3 

41.09 

3 

43.99 

3 

48.7 

3 

41.78 

4 

48.9 

4 

47.61 

4 

50.38 

4 

49.61 


1.7.1 Programa de SAS 

A continuación el programa SAS y la salida que responde a las preguntas anteriores y 
además prueba la normalidad de los residuales. 


Análisis de Experimentos con el Sistema SAS 




Centro de Estadística y Calculo, Facultad de Agronomía. USAC 


7 


OPTIONS NODATE; 
DATA dos; 

INPUT trat minutos; 
CARDS; 

0 3.96 
0 6.24 


4 47.61 
4 50.38 
4 49.61 

PROC GLM; 

CLASS trat; 

MODEL minutos=trat; 

MEANS trat/TUKEY; 

OUTPUT OUT=res r=rmin; 

RUN; 

PROC PRINT DATA=res; 

RUN; 

PROC UNI VARI ATE PLOT NORMAL DATA=res; 

VAR rmin; 

RUN; 


1.7.2 Salida de SAS 


SAS 



Genera 

1 L¡ near Model 

s Procedure 



Cl 

ass Level Information 



Cl ass Level s 

Val ues 



TRAT 

5 

0 12 3 4 



N u mb e r o f 

observations i 

n data set = 20 




SAS 




Genera 

1 Li near Model 

s Pr ocedur e 


Dependent 

Variable: MINUTOS 

Sum of 

Mean 


Source 

DF 

Squar es 

Squar e 

F Val ue Pr > F 

Model 

4 

4387.237470 

1096.809367 

173.25 0.0001 

Error 

15 

94. 960550 

6. 330703 


Cor r ect ed 

Total 19 

4482.198020 




R- Squar e 

C. V. 

Root MSE 

MI ÑUTOS Mean 


0.978814 

7.618279 

2. 516089 

33.0270000 
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General Linear Models Procedure 
Dependent Variable: MINUTOS 


Source 

DF 

Type 1 SS 

Mean Square 

F Val ue 

Pr 

> F 

TRAT 

4 

4387.237470 

1096. 809368 

173.25 

0 . 

0001 

Source 

DF 

Type III SS 

Mean Square 

F Val ue 

Pr 

> F 

TRAT 

4 

4387.237470 

1096. 809368 

173.25 

0 . 

0001 


SAS 

General Linear Models Procedure 

Tukey's Studentized Range (HSD) Test for variable: MINUTOS 
NOTE: This test Controls the type I experi mentwi se error rate, but 
general I y has a higher type II error rate than REGWQ. 

Al pha = 0. 05 df = 15 MSE= 6.3 30 70 3 
Critical Valué of Studentized Range= 4.367 
Mi ni mum Significant Di fference= 5.4938 
Means with the same letter are not significantly different. 


Tukey Groupi ng 


Mean N TRAT 


A 49.125 4 4 

A 43.890 4 3 

B 36.285 4 2 

C 2 9.1 52 4 1 

D 6.68 2 4 0 


1 

0 

3. 96 

- 2. 

7 2 2 5 

2 

0 

6. 24 

• 0 . 

442 5 

3 

0 

5.42 

- 1 

2 62 5 

4 

0 

11. 11 

4. 

4 2 7 5 

5 

1 

27. 31 

- 1 

842 5 

6 

1 

26. 96 

- 2. 

1925 

7 

1 

32. 21 

3. 

0 5 7 5 

8 

1 

30. 13 

0 . 

9 7 7 5 

9 

2 

35. 30 

■ 0 . 

98 5 0 

10 

2 

34. 71 

• 1. 

5 7 5 0 

11 

2 

36. 75 

0 . 

4 6 5 0 

12 

2 

38. 38 

2. 

09 5 0 

13 

3 

41. 09 

■ 2. 

8000 

14 

3 

43. 99 

0 . 

1000 

15 

3 

48. 70 

4. 

8100 

16 

3 

41. 78 

- 2. 

1100 

17 

4 

48. 90 

■ 0 . 

2 2 5 0 

18 

4 

47. 61 

• 1. 

515 

19 

4 

50. 38 

1 

255 

20 

4 

49. 61 

0 . 

485 


Vari abl e =RMI N 


SAS 

UNI VARI ATE PROCEDURE 

Moment s 


N 

20 

S u m Wg t s 

20 

Mean 

0 

Su m 

0 

Std Dev 

2.235604 

Vari anee 

4.997924 

Skewnes s 

0.838511 

Kurtosis 

- 0.02402 

uss 

94.96055 

CSS 

94.96055 

C V 


Std Mean 

0.499896 

T: Mean =0 

0 

P r o b >| T | 

1.0000 

Sgn Rank 

- 11 

Pr ob>| S| 

0.7012 

Num A = 0 

W: Ñor mal 

20 

0.921031 

P r o b <W 

0. 1096 




SAS 





UNI VARI ATE 

PROCEDURE 




Quanti 1 es 

( Def =5) 


100% 

Max 

4. 81 

99% 

4. 81 

7 5% 

Q3 

1. 11625 

95% 

4. 61875 

5 0% 

Med 

■ 0.3 3 3 7 5 

90% 

3. 7425 
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2 5% Q1 

■ 1.7 08 7 5 

10% 

•2.4575 

0% Mi n 

- 2. 8 

5% 

-2. 76125 



1% 

■ 2. £ 

Range 

7. 61 



Q3-Q1 

2. 825 



Mode 

- 2. 8 




SAS 




UNI VARI ATE 

PROCEDURE 



Ext re 

mes 


Lowes t 

Obs 

Hi ghest 

Obs 

- 2. 8( 

13) 

1. 2 5 5 ( 

19) 

- 2. 72 2 5( 

1) 

2.095( 

12) 

- 2. 1 9 2 5( 

6) 

3. 0 5 7 5 ( 

7) 

-2. 11( 

16) 

4. 42 75( 

4) 

• 1.842 5 ( 

5) 

4. 81 ( 

15) 


Vari abl e =RMI N 

St em Leaf 


2 11 
0 15503 
0 8653042 
2 8 7 2 1 


SAS 

UNI VARI ATE PROCEDURE 

# 

2 

2 

5 

7 


+-+-+-+ 


Boxpl ot 

I 

I 

+--+-■ + 


SAS 


UNI VARI ATE PROCEDURE 


Vari abl e =RMI N 


Ñor mal Probability Plot 

5+ * +*++++++ 

| *+*++++++ 

1 + ++***+** + 

| +**+***** 

-3+ * +++*++*+* 

+ - + - + - + - + - + - + - + - + - + - + 

-2 -1 0 +1 +2 


2. DISEÑO DE BLOQUES COMPLETOS AL AZAR 
2.1 Características del diseño 

Es el más usado en la experimentación agrícola, y es aquel en que: 

a. Es conveniente su empleo cuando se logra determinar una gradiente de variabilidad en 
un sentido, pudiendo ser esta climática, edáfica, o de otro tipo. 

b. Las unidades experimentales se distribuyen en grupos o bloques, de tal manera que las 
unidades experimentales dentro de un bloque sean relativamente homogéneas, y 
además el número de unidades experimentales dentro de un bloque debe ser igual al 
número de tratamientos a investigar. 

c. Los tratamientos se asignan al azar a las unidades experimentales dentro de cada 
bloque, de manera independiente 


2.2 Algunas recomendaciones para su uso 


Análisis de Experimentos con el Sistema SAS 






Centro de Estadística y Calculo, Facultad de Agronomía. USAC 


10 


i. Dividir el lugar donde se llevará a cabo el experimento en grupos homogéneos 
(bloques). Cada bloque completo será una repetición. 

ii. Los bloques se colocarán en forma perpendicular a la gradiente que se ha establecido. 

iii. Dividir el bloque en tantas unidades experimentales como tratamientos se quieran 
estudiar. Cada tratamiento debe aparecer una sola vez en cada bloque. 

iv. Tratar que la parcela experimental quede localizada de tal manera que su longitud más 
grande esté orientada paralelamente a la gradiente. 

v. Sortear independientemente en cada bloque los distintos tratamientos. 

vi. En el manejo del experimento, tratar que éste sea lo más homogéneo posible. En otras 
palabras, realizar en un mismo día actividades como fertilización, riego, aplicación de 
fungicidas, etc.; lo ideal sería para el experimento completo; de no poderse, efectuar 
las actividades por bloques completos. En conclusión no hacer trabajos que dejen 
bloques incompletos. 


2.3 Ventajas 

a. Al usar un bloques al azar se obtienen resultados más precisos que cuando se usa un 
completamente al azar. 

b. Puede incluirse cualquier número de tratamientos y repeticiones hasta donde sea 
prácticamente posible. (Es recomendable que el número de tratamientos evaluados no 
sea superior a 15 ) 

c. Análisis estadístico fácil. 

d. Si se pierden unidades experimentales (hasta 3) el análisis estadístico sigue siendo 
fácil. (Ver datos perdidos sección 2.8) 

e. Si se pierde un tratamiento completo se analiza como un tratamiento menos; si es un 
bloque completo, como una repetición menos. 


2.4 Desventajas 

a. Hay menor número de grados de libertad para el error experimental respecto al diseño 
completamente al azar. 

2.5 Aleatorización 
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Cuando las unidades experimentales han sido agrupadas en bloques; los tratamientos se 
asignan aleatoriamente a las unidades dentro de cada bloque. 

Para hacer ésta asignación se puede usar el Procedimiento PLAN de SAS (PROC PLAN), 
un simple sorteo, o bien usando una tabla de números aleatorios. Ejemplo: si fueran cuatro los 
tratamientos a evaluar, numerarlos correlativamente, y luego con la tabla de números aleatorios 
ubicar en la primera unidad experimental el primer número que aparezca y que esté comprendido 
entre 1 y 4, hasta completar los cuatro números. El mismo procedimiento para los siguientes 
bloques. 


2.6 Modelo Estadístico 


Yij - p + T¡ + (3j + £¡j i = 1,2, . . . t 

j = 1,2, . .. r 


de donde, 


Y¡j = Variable de respuesta de la ij-ésima unidad 
experimental 

p = Efecto de la media general 
T¡ = Efecto del i - ésimo tratamiento 


Pj= Efecto del j - ésimo bloque 

£¡j= Efecto del error experimental asociado a la ij- 
ésima unidad experimental 


2. 7. Análisis de Varianza 

2.7.1 Hipótesis 

Ho: T = Ti (Todos los tratamientos producen el mismo efecto) 

Ha: T ^ T¡ para al menos un i; i = 1,2, ... t. (Al menos uno de los tratamientos produce 

Efectos distintos) 

2.7.2 Tabla de Datos 
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Tratamientos 



Repeticiones 



1 

2 

3 

r 


1 

Yn 

y 12 

y 13 

Yj r 

Yi. 

2 

y 21 

y 22 

y 23 

Y 2r 

y 2 . 

3 

Y 3 i 

y 32 

y 33 

Y 3r 

y 3 . 


t 

Y,i 

Y e 

Ye 

Y tt 

Y t . 


Y i 

Y. 2 

y 3 

Y, 

Y . 


2.7.3 Tabla de Análisis de Varianza 


FV GL SC 


CM 


Fe 


Bloques 


r- 1 



Y 2 

tr 


Tratamientos t - 1 



SC tra t /gltraí CM trat /CM ee 


Error exp. (t -1) (r -1) SCtotal-SCtrat - SC bloque SCee /gl ee 


Total 


tr - 1 


Lie 

;=i j =i 


tr 


2.7.4 Regla de Decisión 


Previo a decidir sobre el rechazo o no de la hipótesis planteada deberá desarrollarse el 
análisis de varianza completo, cuya tabla guía se presenta en 2.7.4. 


Rechazar Ho. si Fe > Ft (gl trat; gl error- a) 

No Rechazar Ho. si Fe < Ft (gl trat; gl error; a) 
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Ft = Valor tabular que puede ser encontrado en la tabla 1 del apéndice, considerando gl trat y gl error. 


2.8 Datos Perdidos 

Frecuentemente en la práctica por razones ajenas puede ocurrir: 

a. Que se pierda un bloque completo 

b. Que se pierda un tratamiento completo 

c. Que se pierdan unidades experimentales. 


Qué hacer en cado uno de estos casos: 

a. Si el perdido es un bloque completo realizar el análisis con una repetición menos. 

b. Si se pierde un tratamiento completo analizar el experimento con un tratamiento 
menos. 

c. Si existen unidades experimentales perdidas, es posible hacer una estimación de sus 
valores mediante los siguientes procedimientos: 


2.8.1 Una (1) Unidad Perdida. 

El procedimiento en éste caso es sencillo ya que basta aplicar las siguiente fórmula para 
estimar el valor perdido. (Ver nota importante pagina 15). 


de donde: 

Yij = dato estimado o perdido 
r = número de bloques 

_ rB + tT-S 
ij ~(r- 1) (r-1) 

B = Suma de las observaciones en el mismo bloque de la observación perdida. 
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t = Número de tratamientos. 

T = Suma de las observaciones con el mismo tratamiento de la observación perdida. 


S = 


Y i. + Yj 

a =- 

2 


b = 


Y i. + Y.j 

2 


Suma de todas las observaciones reales. 


2.8.2 Dos (2) Unidades Perdidas: 

Para estimar el valor para dos estimaciones perdidas se emplea el método iterativo que 
consiste en la aplicación de las siguientes fórmulas: 


= Promedio del tratamiento con la unidad perdida 
= Promedio del bloque con la unidad perdida 


Y i. + Yj 

a =- 

2 


rB + tT-S 
~(r- 1) (f-1) 


Teniendo los datos ordenados se identifican arbitrariamente las dos unidades 
_ perdidas como a ó b, y luego se aplica la fórmula para "a" y después usamos la 
Y /.fórmula para "b"; enseguida omitimos el valor estimado en "a" y volvemos a 
T../aplicar "b", repetimos el mismo proceso omitiendo el nuevo valor de "b". 
Detenemos este método iterativo hasta que los valores se repitan y los dos últimos 
serán los valores a usar para el posterior análisis.(Ver nota importante página 15). 


2.8.3 Tres (3) Unidades Perdidas 

Se emplea también el método iterativo; usando las siguientes fórmulas: 
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Con la tabla de datos ya ordenada identificar arbitrariamente con las letras a, b y c 
las unidades experimentales perdidas y aplicarles a cada una las fórmulas 
correspondientes. Hecho lo anterior omitir el valor encontrado de "a" y volverlo a 
calcular usando "c". Hacer los mismo para "b" y "c" originales; repetir el ciclo las 
veces que sean necesarias hasta que los valores para cada uno se repitan. 
Encontrados los valores proseguir con el análisis. (Ver la siguiente nota 

rB + tT-S 
C ~(r- 1) (r- 1) 

importante ). 


Nota Importante : 

a. Lo descrito anteriormente tiene justificación siempre y cuando las unidades 
experimentales estén localizadas en bloques y tratamientos diferentes. 

b. Al realizar el análisis de varianza; tener presente que debemos restarle a los grados de 
libertad del total y del error experimental un número que es igual al número de 
unidades experimentales estimadas (k) así: 

gl Total = tr - 1 - k 
gl error = (t-l)(r-l)-k 

c. Al realizar la prueba de Tukey o SNK usar el comparador W cuando se esté 
comparando el tratamiento al cual se le estimó el valor, con cualquier otro: 


q = valor tabular que aparece en la tabla de Tukey 
p = número de tratamientos 


W = 


9 ( 


p,glee, a) 


*Sx 


Sx = 


CME 


+ 



2.9 Ejemplo de Aplicación 
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Con el propósito de comparar el efecto de cinco fuentes diferentes de nitrógeno y un 
control sobre la producción de materia seca de cebada forrajera, se condujo un experimento 
empleando un diseño en bloques completos al azar. Las cinco fuentes evaluadas fueron: 

1. (NH 4 ) 2 2. NH 4 N0 3 3. CO (NH 4 ) 3 

4. Ca (N0 3 )2 5.NaN0 3 6. Control (sin fertilizante) 


Dado que se deseaba aplicar los resultados sobre condiciones relativamente amplias, se 
decidió realizar el experimento en cuatro tipos de suelo. De esta manera, el diseño experimental 
usado fue el de bloques al azar para asi poder controlar con los bloques el efecto de los diferentes 
tipos de suelo. A la madurez del cultivo, se cosecharon las diferentes unidades experimentales y se 
midió la cantidad de materia seca de forraje producido. Las producciones (en kilogramos por 
parcela) se presentan en el cuadro 2. 

Cuadro 2: Producción (kilogramos por parcela) de cebada de los seis tratamientos nitrogenados. 


Tratamientos 


Bloques 



I 

II 

III 

IV 

1 

32.1 

35.6 

41.9 

35.4 

2 

30.1 

31.5 

37.1 

30.8 

3 

25.4 

27.4 

33.8 

31.1 

4 

24.1 

33.0 

35.6 

31.4 

5 

26.1 

31.0 

33.8 

31.9 

6 

23.2 

24.8 

26.7 

26.7 


2.9.1 Programa de SAS 


A continuación el programa SAS y la salida que considera el análisis de varianza de dos 

vías. 

OPTIONS NODATE; 

DATA dos; 

INPUT bloque $ fuente matsec; 

CARDS; 

I 1 32.1 
I 2 30.1 
I 3 25.4 
I 4 24.1 
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IV 4 31.4 
IV 5 31.9 
IV 6 26.7 


PROC ANOVA; 

CLASS fuente bloque; 

MODEL matsec= bloque fuente; 
MEANS fuente/TUKEY; 

RUN; 


2.9.2 Salida de SAS 


The SAS System 


Analysis of Variance Procedure 
Class Level Information 


Cl ass Level s Val ues 
FUENTE 6 123456 


BLOQUE 4 I II III IV 


Number of observations in data set = 24 


The SAS System 

Analysis of Variance Procedure 


Dependent Variable: MATSEC 




Sum of 

Mean 


Source 

DF 

Squar es 

Squar e 

F Val ue Pr > F 

Model 

8 

447.83166667 

55.97895833 

18.86 0.0001 

Error 

15 

44.52791667 

2.96852778 


Cor r ect ed Total 

23 

492.35958333 




R-Squar e 

C. V. 

Root MSE 

MATSEC Mean 


0.909562 

5.584146 

1.7229416 

30.854167 


Source 

DF 

Anova SS 

Mean Square 

F Val ue 

Pr > F 

FUENTE 

5 

255.27708333 

51.05541667 

17.20 

0.0001 

BLOQUE 

3 

192.55458333 

64. 184861 1 1 

21.62 

0.0001 


The SAS System 

Analysis of Variance Procedure 

Tukey's Studentized Range (HSD) Test for variable: MATSEC 

NOTE: This test Controls the type I experi mentwi se error rate, but 
general I y has a higher type II error rate than REGWQ. 

Al pha = 0. 05 df = 15 MSE = 2.968 5 2 8 
Critical Valué of Studentized Range= 4.595 
Mi ni mum Significant Difference= 3.9582 

Means with the same letter are not significantly different. 
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Tukey Groupi ng 
A 

B A 


C 


Mean N FUENTE 

36.250 4 1 

32.3 7 5 4 2 

3 1.02 5 4 4 

30.700 4 5 

29.425 4 3 

2 5.3 5 0 4 6 


3. COMPARACION MULTIPLE DE MEDIAS 


El análisis de varianza indica si existe o no variación entre los tratamientos y una vez 
encontrada ésta variación el procedimiento que señala qué tratamiento (s) está (n) causando esa 
variación es la comparación múltiple de medias; cuyas pruebas más usuales son: Tukey, Duncan, 
SNK; aunque también pueden ser usadas pruebas como Bonferroni, Scheffé, Deponly, Bon, 
Dunnett, Gabriel, Sidak, Waller, u otras según sean las necesidades del problema de aplicación. 


3.1 Prueba de Tukey 
Procedimiento 
a. Calcular el comparador W. 


de donde: 

q = valor que aparece en la tabla de Tukey 
glee = grados de libertad del error 

W — n Cr 

vv H (p,glee,~ a) 

p = número de tratamientos 
c [CME 

Sx= -j— 

Sx = Error estándar de la media 
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r = número de repeticiones 


Wp = q iP ' gke „ ) *Sx 


Sx = 


¡CME 

r 


a = nivel de significancia. 

b. Encontrar las diferencias entre las medias 

Para encontrar todas las posibles diferencias es necesario hacer un cuadro de doble 
entrada colocando horizontalmente las medias ordenadas de mayor a menor y 
verticalmente de menor a mayor; llenando el cuadro con las respectivas diferencias, 
(di) 

c. Regla de Decisión 

Encontradas las diferencias de las medias, comparar cada una de ellas con W, tomando 
en consideración lo siguiente: 

Hay diferencia significativa si | d; I > W ( * ) 

No hay diferencia significativa si I d| | < W (ns) 

I dj | = valor absoluto de la diferencia entre dos tratamientos. 

d. Presentación de medias 

Esta presentación se hace ordenando verticalmente las medias de mayor a menor. Unir 
luego con una misma letra o línea, aquellas medias que son significativamente 
diferentes (ns). 


3.2 Prueba de SNK 

Es una modificación de la prueba de Tukey; en donde se usan varios comparadores. 
Procedimiento: 

a. Cálculo de comparadores (Wp) 


donde: 
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q = valor que aparece en la tabla de Tukey 
glee = grados de libertad para el error 

i = 1,2,3,. . • t 
r = número de repeticiones 

b. Encontrar las diferencias entre las medias: igual a Tukey. 

c. Regla de Decisión 

Esta prueba no exige que la diferencia entre dos medias sea tan grande como sucede 
en Tukey para declarar significativa la diferencia. A mayor diferencia entre los 
tratamientos corresponde un mayor comparador, manteniendo esta regla de decisión. 


Hay diferencia significativa si | dj | > W ( * ) 

No hay diferencia significativa si I dj | < W (ns) 

I dj | = valor absoluto de la diferencia entre dos tratamientos. 


d. Presentación de Medias 
Igual a Tukey. 


4. DISEÑO CUADRADO LATINO 


4.1 Características 

En este diseño se impone a las unidades experimentales una restricción del tipo de doble 
bloqueo (hileras y columnas), es decir, la agrupación es en dos sentidos. Los tratamientos se 
agrupan en repeticiones de dos maneras distintas; cada hilera y cada columna constituye una 
repetición completa. 
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Por lo tanto, cada tratamiento debe aparecer una y solo una vez por columna y por hilera 
de tal manera que cualquier comparación de tratamientos no se vea afectada por las diferencias 
existentes entre hileras o entre columnas. En este diseño el número de hileras (h), número de 
columnas (c) y el número de tratamientos (t) debe ser igual. De tal manera que el número total de 
unidades experimentales será igual a: 


i 2 ^ 2 * *2 

h o c o t 

Por lo anterior el uso de este diseño se recomienda para conducir experimentos en 
condiciones heterogéneas siempre y cuando podamos bloquear en dos sentidos. Ejemplo en el 
campo: 


fertilidad - salinidad 

fertilidad - sembradora 

jornada de trabajo - edad del operario 


4.2 Ventajas 

a. Análisis estadístico fácil 

b. Controla más las fuentes de variación que el diseño en bloques al azar, pues controla la 
variación de hileras, columnas y tratamientos; o sea que disminuye el error 
experimental al extraer estas tres fuentes de variación. 


Para aprovechar las ventajas de ésta distribución, es indispensable lo siguiente: 

a. Dividir el lote, o lugar de la experiencia en un número de unidades experimentales 
igual al cuadrado del número de tratamientos. 

b. El número de repeticiones debe ser igual al número de tratamientos. 

c. Formar hileras y columnas de unidades experimentales iguales al número de 
repeticiones y de tratamientos. 

d. Distribuir los tratamientos en tal forma que ningún tratamiento se repita en fila ni en 
columna ( ver aleatorización ). 


4.3 Desventajas 

a. Disminuye el número de grados de libertad para el error experimental. 

b. Sólo se puede usar cuando se tiene un número limitado de tratamientos ( usualmente 
entre 4 y 8 ). 
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4.4. Aleatorización 

Cuadrado Latino Reducido: 

Es aquel en el cual la primera hilera y la primera columna están dispuestas en orden 
alfabético. 

Procedimiento 

a. Seleccionar un cuadrado latino reducido 

b. Permutar hileras aleatoriamente 

c. Permutar columnas aleatoriamente 

d. Asignar los tratamientos a las letras al azar. 

Los incisos b,c,d se pueden realizar usando una tabla de números aleatorios, o bien a 
través de un simple sorteo. 


4.5 Modelo Estadístico 


Yjjk — p + H¡ + Cj + Tk + £¡jk 
i = 1,2,3, . . . h =n 

j = 1,2,3, . . . c = n h =c = t = n 

k =1,2,3, ...t =n 


de donde: 


Y¡jk = Variable de respuesta de la ijk - ésima unidad experimental 
p = Efecto de la media general 
H¡ = Efecto de la i - ésima fila 
Cj = Efecto de la j - ésima columna 
x k = Efecto del k - ésimo tratamiento 

£¡jk= Error experimental asociado a la ijk - ésima unidad experimental 


4.6 Análisis de Varianza 
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4.6.1 Hipótesis 

Ho: T = (Todos los tratamientos producen el mismo efecto) 

Ha: T A T¡ para al menos un i; i = 1,2, ... t. (Al menos uno de los tratamientos produce 

efectos distintos) 


4.6.2 Tabla de Datos ( para un cuadrado latino 4*4) 


Columnas 

Filas 

1 

2 

3 

4 

Total 
hileras Yj 

1 

Ynk 

Y nk 

Yl3k 

Yl4k 

Yi.... 

2 

Yl 2k 

Y22k 

Y23k 

Y24k 

y 2 .. 

3 

Yl3k 

Y32k 

Y33k 

Y34k 

y 3 .. 

4 

Yl4k 

Y42k 

Y43k 

Y44k 

y 4 .. 

Total 

columnas 

Y.j. 

Y i.. 

Y.2.. 

Y.3.. 

Y.4.. 

Y 

(Gran 

total) 

Donde k=l,2,3,4. 







La tabla anterior se obtiene sin modificar el croquis de campo. Puede generarse una tabla 
adicional para los tratamientos, sumando todas las veces que se repitió cada tratamiento, 
obteniendo asi el respectivo total (Y.. k ), como se indica a continuación: 


Tratamientos 


Yiji 

Yiji 

Yiji 

Yiji 


2 

Yij2 

Y.n 

Y.n 

Yij2 


3 

y 1j3 

y 1j3 

y 1j3 

y 1j3 


Y.n 

y 1j4 

y 1j4 

y 1j4 
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JCMF. 

CV = Y * 1Q0 


Total 
Tratamientos 

Y. k 


t 


Media Tratamientos 


Media general = 

4.6.3 Tabla de Análisis de Varianza 


FV 

gl 

SC 


CM 

Fe 

Tratamientos 

t- 1 

¿ y ..1 

Y 2 

SCtraR§l trat 

CM trat /CM ee 



k = 1 






t 

t 2 




Hileras 


Y 



Columnas 


/ 



Error exp.(ee) (t -1) (t - 2) SC total- {SC trat + SCH + SCee /gl ee 

SCC} 


Total 


t 2-l 




ijk 


/=! j =1 k= 1 



4.6.4 Regla de Decisión 


Rechazar Ho. 

No Rechazar Ho. 


SÍ Fe Ft (gl trat; gl error; a) 
SÍ Fe < Ft (g] trat; gl error; a) 
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4.7 Datos Faltantes. 


Cuando se tiene una unidad experimental perdida se usa la fórmula que se da a 
continuación-obtenida por un procedimiento similar al de bloques al azar, es decir minimizando la 


suma i 


t(H + C + T)-2S 
(f-l)(f-2) 

Donde; 


t = número de tratamientos 

H = total de valores observados para la hilera que contiene la unidad faltante 
C = total de valores observados para la columna que contiene la unidad faltante 
T = total del tratamiento que contiene la unidad faltante 
S = gran total de valores reales observados. 


Luego se efectúa el ANDEVA, restando uno (1) a los grados de libertad del total y del 
error experimental. Cuando se efectúan las comparaciones de medias de tratamientos se deben 
observar las mismas precauciones mencionadas para el diseño en bloques al azar ; es decir, que 
cuando se esté comparando el tratamiento al cual le estimamos el valor se deberá usar el error 
estándar siguiente: 


Sx = 


CME 


+ 



Si los valores perdidos son dos o más usar el método iterativo ( descrito en bloques al 
azar) empleando las siguientes fórmulas: 


b. La fórmula para una unidad experimental perdida 


4.8 Ejemplo de aplicación 
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Un ensayo con el propósito de evaluar el efecto de cinco productos químicos sobre la 
longitud (cm) de la parte aérea de plántulas de café noventa días después de la siembra, incluyó 
los siguientes productos: 


A: Nitrato de potasio 
B: Thiourea 

C: Mezcla 1: Biozime T.S. 

D: Mezcla 2: Bellgro PGR IV 
E: Testigo (sin aplicación) 

Los tratamientos se distribuyeron mediante un diseño en cuadrado latino, y los resultados 
de la evaluación se aprecian en el cuadro 3. 


Cuadro 3: Valores de longitud (cm) de la parte aérea de plánulas de café. 


E 

A 

C 

D 

B 

2.4 

2.4 

1.9 

2.4 

2.0 

B 

C 

E 

A 

D 

1.7 

2.4 

2.7 

3.6 

3.0 

A 

B 

D 

E 

C 

2.7 

2.1 

3.8 

2.6 

1.8 

D 

E 

B 

C 

A 

2.6 

3.1 

2.3 

2.2 

2.6 

C 

D 

A 

B 

E 

2.9 

3.1 

3.0 

2.0 

2.2 


4.8.1 Programa de SAS 

A continuación el programa SAS y la salida que considera el análisis de varianza en 
cuadrado latino. 


OPTIONS NODATE; 

DATA dos; 

INPUT columna fila trat $ long; 
CARDS; 

1 1 A 2.4 
1 2B 1.7 
1 3 C 2.7 
1 4 D 2.6 

1 5 E 2.9 

2 1 B 2.4 
2 2 C 2.4 
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5 2 A 3.0 
5 3 B 1.8 
5 4 C 2.6 
5 5 D 2.2 

PROC GLM; 

CLASS columna fila trat; 
MODEL long= columna fila trat; 
MEANS trat/TUKEY; 

RUN; 


4.8.2 Salida de SAS 



The SAS 

Syst em 

Analysi s 

of Var 

i anee Procedure 

Cl ass 

Level 

1 n f o r ma t i o n 

Cl ass 

Level 

s Val ues 

COLUMNA 


5 1 2 3 4 5 

F1 LA 


5 1 2 3 4 5 

TRAT 


5 A B C D E 


Number of observations in data set = 25 


The SAS System 

Analysis of Variance Procedure 


Dependent 

Variable: LONG 

Sum of 

Mean 


Source 

DF 

Squar es 

Squar e 

F Val ue Pr > F 

Model 

12 

4.48800000 

0. 37400000 

1.98 0.1263 

Error 

12 

2.27200000 

0.18933333 


Cor r ect ed 

Total 24 

6.76000000 




R- Squar e 

C. V. 

Root MSE 

LONG Mean 


0. 663905 

1 7. 1 3089 

0.4351245 

2.5400000 


Source 

DF 

Anova SS 

Mean Square 

F Val ue 

Pr > F 

COLUMNA 

4 

0.50800000 

0. 12 700000 

0.67 

0.6247 

F1 LA 

4 

0.68000000 

0. 1 7000000 

0.90 

0.4951 

TRAT 

4 

3.30000000 

0.82500000 

4. 36 

0.0209 


The SAS System 

Analysis of Variance Procedure 

Tukey's Studentized Range (HSD) Test for variable: LONG 

NOTE: This test Controls the type I experi mentwi se error rate, but 
general I y has a higher type II error rate than REGWQ. 

Al pha = 0. 05 df = 12 MSE = 0.189333 
Critical Valué of Studentized Range= 4.508 
Mi ni mum Significant Di fference= 0.8772 

Means with the same letter are not significantly different. 
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Tukey Groupi ng 


TRAT 


A 

B A 

B A 

B A 


B 


2.9800 5 D 

2.8600 5 A 

2.6000 5 E 

2.2400 5 C 

2.02 00 5 B 


5. EXPERIMENTOS FACTORIALES 

5.1 Conceptos 

5.1.1 Experimentos Factoriales 


Son aquellos en donde se estudian simultáneamente dos o más factores; cada uno 
incluyendo una serie de niveles. 

Los experimentos factoriales no son diseños de campo sino simplemente una modalidad de 
estudio simultáneo de tratamientos; la combinación o arreglo de tratamientos se puede distribuir 
en bloques al azar, completamente al azar o cuadrado latino. 

El arreglo combinatorio de tratamientos consiste en hacer todas las combinaciones 
posibles entre los niveles de cada uno de los factores estudiados y considerar cada combinación 
como un tratamiento. 

Factor: 


Un factor es un conjunto de tratamientos que se pueden aplicar a las unidades 
experimentales. Generalmente se denotan con letras mayúsculas (A,B, ... Z o con las iniciales de 
los factores a probar). Los factores pueden ser cuantitativos (cantidad de fertilizante, de 
insecticida, una hormona, de tiempo, temperatura, concentración, etc.) o cualitativos (variedades, 
métodos de aplicación, marcas de producto, razas, procedencia, etc.). 


Nivel: 


Un nivel de un factor es un tratamiento particular de un conjunto de tratamientos que 
constituyen un factor. Si el factor es cuantitativo, los niveles están formados por las cantidades o 
dosis del mismo; si el factor es cualitativo los niveles los constituyen las manifestaciones del 
mismo o los tratamientos dentro del factor (nombres de las variedades, diferentes métodos de 
aplicación,las diferentes marcas del producto, las diferentes razas, etc.). Por lo general se 
identifican con letras minúsculas (a , a 2 >. . . ; bj, \¡2, ■ ■ .; vj, V 2 > • • .; etc.) 

Efecto simple: 
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El efecto de un factor a un solo nivel de otro factor o en una sola combinación de otros 
factores se conoce como efecto simple. Si se promedian esos efectos simples se obtiene un efecto 
principal, y de manera más general, el efecto principal de un factor es una comparación entre 
respuestas esperadas para los diferentes niveles de un factor, promediados sobre todos los niveles 
de todos los otros factores. 

Interacción: 

Interacción es el fracaso de los niveles de un solo factor de responder de la misma forma 
frente a los niveles de otro factor o factores. Cuando dos factores interactúan la respuesta a los 
cambios de un factor está condicionado por el nivel de otro factor. 


Factorial simétrico: 

Es aquel en donde cada factor presenta igual número de niveles, pudiéndose presentar 
mediante la notación p n , donde p se refiere al número de niveles y n al número de factores. 


Factorial asimétrico: 

Es aquel en donde cada factor presenta desigual número de niveles, pudiendo 
representarse como p x q, donde p identifica los niveles del primer factor y q los niveles del 
segundo factor. 


5.2 Ventajas 

a. Se logra una gran eficiencia en el uso de los recursos experimentales disponibles. 

b. Se obtiene información respecto a las diversas interacciones. 

c. Los resultados experimentales son aplicables a un rango de condiciones más amplio 
debido a las combinaciones de los diversos factores en un solo experimento. Los 
resultados son de naturaleza más comprensiva. 

d. Los experimentos factoriales son más eficientes que los experimentos simples. 


5.3 Desventajas 

a. El resultado del experimento y el análisis estadístico resultante son más complejos. 

b. Con un gran número de combinaciones de tratamientos, la relación de unidades 
experimentales homogéneas es más difícil. 
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c. Convencidos de que algunas de las combinaciones de tratamientos pueden ser de muy 
poco o ningún interés, algunos de los recursos experimentales puden ser malgastados. 

d. El número de tratamientos o combinaciones aumentan rápidamente. 

5.4 Cuando Usarlos 

La elección de un experimento factorial responderá a la necesidad de evaluar 
simultáneamente dos o más factores. Ejemplos: 

a. Variedades y dosis de fertilizantes (2 factores) 

b. Distancias de siembra, niveles de nitrógeno (2 factores) 

c. Dosis, épocas y formas de aplicación de diferentes hormonas (3 factores) 

5.5 Modelo Estadístico 


El modelo que se describe corresponde a un experimento bifactorial, en arreglo 
combinatorio dispuesto en un diseño en bloques completos al azar, debido a que es el más usado. 


Yjjk— (i + A¡ + Bj + AB¡j + Pk + £¡jk 


donde: 

Y¡j k = variable de respuesta asociada a la ijk - ésima unidad experimental 

p = Efecto de la media general 

A¡ = Efecto del i - ésimo nivel del factor "A" 

B¡ = Efecto del j - ésimo nivel del factor "B" 

AB¡j = interacción del i - ésimo nivel del factor "A" con el j - ésimo nivel del factor "B" 
Pk = Efecto del k - ésimo bloque 
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£¡jk = error experimental asociado a la ijk - ésima unidad experimental 

5.6 Análisis de Varianza 

5.6.1 Hipótesis 

Ho: A¡ = 0 contra, 

Ha: No todos los A¡ = 0 
Ho: B¡ = 0 contra, 

Ha: No todos los B¡ = 0 
Ho: (AB)ij = 0 contra, 

Ha: No todos los (AB)¡j = 0 

Con mucha frecuencia éstas son las hipótesis que se deben probar. 


5.6.2 Tabla de Datos 

(Factorial 3 * 2 en bloques al azar) 


Bloques 


Ai 



A2 



A3 




Bi 


b 2 

Bi 


b 2 

Bi 


b 2 

Y.jc 

I 

Yin 


Yu2 

Y121 


Y122 

Y131 


Y132 

Y..! 

II 

Y211 


Y212 

Y221 


Y222 

Y231 


Y232 

Y. 2 

III 
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Y rll 


Y 21r 


Y 3 i r 


Y r 


Yy. Y„. Y 12 . 

Y 2 i. 

y 22 . 

Y31. 

r y 2 

y.-- 

k= i ab 

5.6.3 Tabla adicional para factores 

F 2 

abr 



a b V 2 

Y- ¡j 

Y 2 


Factor "B" 

/ . ¿actor 

M M r 

"TT" 

abr 

_ Y., 


Ai A 2 

A3 


Bi 

Yn. Y 21 . 

Y31. 

Y.i. 

b 2 

Yi2. Y 22 . 

Y 3 2 . 

y. 2 . 

Y,.. 

Yi.. Y 2 .. 

y 3 „ 

Y... 


Y . . . 


Y . k = Total de bloques 
Yy. = Total de tratamientos 
Yi„ = Total del factor "A" 
Y.j. = Total del factor "B" 
Y... = Gran total 


5.6.4 Tabla de Análisis de Varianza 


FV gl 


se 


CM FC 


Bloques r - 1 


Tratamientos ab - 1 


SC trat /gl 


trat 


CM trat /CM ee 
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A 

a - 1 


SC A /gl A 

CM A /CM ee 

B 

b- 1 


SC B /gl B 

CM B /CM ee 

AB 

(a - 1) (b - 1) 

SCtotal-SC a -SCb 

SC AB /gl A B 

CM AB /CM ee 

Error 

ab-l(r-l) 

SCtotal-SCbloques~SCtrat 

Scee/glee 




a V 2 V 2 



Total 

abr - 1 

V '. 

“7 rb abr 




b V 2 V 2 

E —- — 

ra abr 


Los valores de Fe que aparecen en la tabla sirven para probar hipótesis de la siguiente 


manera: 


1. Para factor "A" 


Fe — C M a/C M e c , Ftab ( a — l; glee ; a ) 


2. Para factor "B" 
Fe = CMBfi/CMee 


a b r 

E E E Y l 


i =1 7=1 k=l 


F 


tab ( b - 1; glee ; a) 


yl 

abr 


3. Para la interacción "AB" 

Fe — C M \ fí/C M e e , Ftab ( a - 1. b - 1 ; glee ; a j 


5.6.5 Regla de Decisión 

Si Fe > Ft Se rechaza la hipótesis nula 
Si Fe < Ft No se rechaza la hipótesis nula 

Para efectuar la prueba de Tukey o SNK seguir el procedimiento anteriormente descrito, 
considerando los comparadores de la manera siguiente: 
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W P = Q(b, g Iee,a) * & 

1. Para factor "A" 


Sx = 


CMee 


ra 


donde: Wp = W.«* & 

q = valor tabular (Consultar tabla de Tukey) 
a = niveles del factor A. 


Sx = 


¡CMee 

r 


Wp = q^gieert * Sx 

a = nivel de significancia 

S x = error estándar 

CMee= cuadrado medio del error 

r = número de repeticiones 

b = número de niveles del factor B. 


Sx = 


CMee 

rb 


2. Para factor "B" 


3. Para la interacción AB 
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A quienes hacerle la prueba de Tukey: ver tabla que aparece en el siguiente tema de 
parcelas divididas (Sección 6.7). 


5.7 Ejemplo de Aplicación 

Se estudió el efecto de diferentes dosis de fertilizante fosforado sobre dos tipos de planta 
de haba Vicia faba. Se pensó que los tipos de planta bien podían responder en forma diferente a la 
fertilización, así que se decidió llevar a cabo un experimento factorial con dos factores: 


Factor 


Nivel 



1 

2 

3 

A. Tipo de Planta 

B. Dosis de Fósforo 

Corto 

0 Kg/ha P 2 0 5 

Alto 

25 Kg/ha P 2 0 5 

50 Kg/ha P 2 0 5 


El experimento se llevo a cabo mediante un diseño en bloques completos al azar en arreglo 
combinatorio, con cuatro repeticiones. Los resultados (producción en kg/ha) se aprecian en el 
cuadro 4. 


Cuadro 4: Producción (kg/ha) de dos tipos de haba bajo diferentes niveles de fertilización de 
fósforo. 


Tipo de 
Planta 

Dosis de 
Fósforo 



Bloques 




I 

II 

III 

IV 


0 

11.5 

13.6 

14.3 

14.5 

Corto 

25 

17.1 

17.6 

17.6 

18.1 


50 

18.2 

17.6 

18.2 

18.9 


0 

11.0 

11.2 

12.1 

12.6 

Largo 

25 

8.3 

10.5 

9.1 

12.8 
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50 15.7 16.7 16.6 17.5 


5.7.1 Programa de SAS 

A continuación el programa SAS y la salida que considera el análisis de varianza con los 
dos factores analizados. 

OPTIONS NODATE; 

DATA dos; 

INPUT bloque planta $ fosforo rend; 

CARDS; 

1 Corto 0 11.5 
1 Corto 25 17.1 


4 Largo 25 12.8 
4 Largo 50 17.5 

PROC GLM; 

CLASS bloque planta fosforo; 

MODEL rend=bloque planta fosforo planta*fosforo; 
LSMEANS planta*fosforo/PDIFF; 

RUN; 


5.7.2 Salida de SAS 


The SAS System 

General Linear Models Procedure 
Class Level Information 


Class Levels 
BLOQUE 4 
PLANTA 2 
FOSFORO 3 


Valúes 
12 3 4 
Corto Largo 
0 25 50 


Number of observations in data set = 24 


The SAS System 

General Linear Models Procedure 


Dependent Variable: REND 
Source DF 


Sum of 
Squares 


Mean 

Square F Valué Pr > F 
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Model 

8 

234.70000000 

29.33750000 

50.72 

0.0001 

Error 

15 

8.67625000 

0.57841667 



Corrected Total 

23 

243.37625000 





R-Square 

C.V. 

Root MSE 


REND Mean 


0.964350 

5.195813 

0.7605371 


14.637500 

Source 

DF 

Type I SS 

Mean Square 

F Valué 

Pr > F 

BLOQUE 

3 

13.32125000 

4.44041667 

7.68 

0.0024 

PLANTA 

1 

77.40041667 

77.40041667 

133.81 

0.0001 

FOSFORO 

2 

99.87250000 

49.93625000 

86.33 

0.0001 

PLANTA*FOSFORO 

2 

44.10583333 

22.05291667 

38.13 

0.0001 

Source 

DF 

Type III SS 

Mean Square 

F Valué 

Pr > F 

BLOQUE 

3 

13.32125000 

4.44041667 

7.68 

0.0024 

PLANTA 

1 

77.40041667 

77.40041667 

133.81 

0.0001 

FOSFORO 

2 

99.87250000 

49.93625000 

86.33 

0.0001 

PLANTA*FOSFORO 

2 

44.10583333 

22.05291667 

38.13 

0.0001 


The SAS System 

General Linear Models Procedure 
Least Squares Means 



PLANTA 

FOSFORO REND 

LSMEAN 




LSMEAN 

Number 


Corto 

0 

13.4750000 

1 


Corto 

25 

17.6000000 

2 


Corto 

50 

18.2250000 

3 


Largo 

0 

11.7250000 

4 


Largo 

25 

10.1750000 

5 


Largo 

50 

16.6250000 

6 


Pr > 

■ |T| H0 

: LSMEAN(i)=LSMEAN(j) 

i/ 

j i 

2 

3 4 

5 6 

1 


0.0001 

0.0001 0.0053 

0.0001 0.0001 

2 

0.0001 


0.2633 0.0001 

0.0001 0.0899 

3 

0.0001 

0.2633 

0.0001 

0.0001 0.0094 

4 

0.0053 

0.0001 

0.0001 

0.0114 0.0001 

5 

0.0001 

0.0001 

0.0001 0.0114 

0.0001 

6 

0.0001 

0.0899 

0.0094 0.0001 

0.0001 


6. ARREGLO EN PARCELAS DIVIDIDAS 


6.1 Características del Arreglo 


Frecuentemente por razones de nuestro interés recurrimos a un experimento factorial que 
pudiera representar dificultades de manejo en algunas ocasiones; por ejemplo si se quiere evaluar: 


FACTOR 

NIVELES 



A. Sistemas de Riego 

Goteo 

Aspersión 

Gravedad 

B. Niveles de nitrógeno 

0 

80 

Kg/ha 
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Cuando se hace la distribución en el campo surge el inconveniente que presenta la 
aplicación de los tratamientos a las unidades experimentales; lo que implica demasiado trabajo. 
Bajo estas circunstancias se justifica el uso del arreglo en parcelas divididas. En este ejemplo el 
factor sistemas de riego es el que ilustra este incoveniente. 


A continuación se presenta la forma como quedarían los tratamientos al usar un arreglo 
combinatorio en bloques al azar. 

BLOQUE I 


Goteo 

Aspersión 

Gravedad 

Goteo 

Gravedad 

Aspersión 

OKg/ha 

80 Kg/ha 

OKg/ha 

80 Kg/ha 

80 Kg/ha 

OKg/ha 


Lo que se pretende al emplear un arreglo en parcelas divididas es que los niveles del factor 
problema se asignen a parcelas graneles (principales), éstos pueden disponerse en cualquiera de 
los diseños ya estudiados (bloques al azar, cuadrado latino ,etc). 

Los niveles del segundo factor se asignan aleatoriamente a las parcelas pequeñas (sub¬ 
parcelas) dentro de cada parcela grande. 

En conclusión se recomienda el uso de parcelas divididas cuando nos represente un ahorro 
de trabajo grande o haga más práctica la conducción del experimento. 


Otras de las razones más comunes para usar parcelas divididas son: 

a. Permite un uso eficiente de algunos tratamientos que necesitan por su naturaleza, tamaños de 
parcela mayores que otros factores; tal es el caso de factores como sistemas de riego, manejo 
de suelos, temperaturas de cuartos fríos, aspersiones, sistemas de siembra. 

b. Proporciona una mayor precisión en la estimación de los efectos de algunos factores 
comparados con otros. Por ejemplo, si los patrones de un cultivo de cítricos se ubica en las 
parcelas principales y las variedades en las subparcelas, el efecto de variedades se estima con 
mayor precisión. 

c. Permiten la introducción de nuevos tratamientos dentro de un experimento que ya está en 
ejecución. 
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BLOQUE I usando parcelas divididas 


Gravedad Goteo Aspersión 


0 Kg/ha 

80 Kg/ha 

0 Kg/ha 

80 Kg/ha 

0 Kg/ha 

80 Kg/ha 


Parcela 

Grande 


Parcela 

Pequeña 


6.2 Ventaja 

a. Facilita el manejo del experimento 

6.3 Desventajas 

a. Análisis estadístico más elaborado. 


b. Se pierde precisión en la estimación de los efectos promedio de los tratamientos 
asignados a las parcelas grandes; suele frecuentemente aumentar la precisión en la 
estimación de los efeíjkrs de los tratamientos asignados a las parcelas pequeñas. 

La razón fundamental de lo anterior se debe a que el error para parcela grande suele ser 
mayor que el error para parcela pequeña. Se sugiere entonces colocar el factor más importante en 
parcela pequeña y el otro en la parcela grande. 

6.4 Aleatorización 

La distribución de los tratamientos a las parcelas grandes (principales) se hace de la 
misma forma que se sugiere para el correspondiente diseño que se use (bloques al azar, cuadrado 
latino, u otro). 

Los tratamientos de las parcela pequeñas (sub-parcelas) se asignan aleatoriamente dentro 
de cada parcela principal en forma independiente para cada una de éstas últimas. 


6.5 Modelo Estadístico ( Para un diseño en bloques al azar ) 


Yjjk— (I + Pj + OCi + + pk + OCpik + £¡jk 
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donde: 

Y¡j k = Variable de respuesta de la ijk - ésima unidad experimental 
p = Efecto de la media general 

P, = Efecto del j - ésimo bloque 

ai = Efecto del i - ésimo nivel del factor A. 

£¡j = Error experimental asociado a la parcela grande 
pk = Efecto del k - ésimo nivel del factor B 

ap ik = Efecto debido a la interacción del j - ésimo nivel del factor A con los k - 
ésimos niveles del factor B. 

£¡jk = Error experimental asociado a la parcela pequeña. 


6.6. Análisis de Varianza 
6.6.1 Hipótesis 

Ho: A¡ = 0 contra, 

Ha: No todos los A¡ = 0 
Ho: B¡ = 0 contra. 

Ha: No todos los B¡ = 0 
Ho: (AB)ij = 0 contra, 


Análisis de Experimentos con el Sistema SAS 




Centro de Estadística y Calculo, Facultad de Agronomía. USAC 


41 


Ha: No todos los (AB)¡j = 0 

Con mucha frecuencia éstas son las hipótesis que se deben probar. 

6.6.2 Tabla de Datos 


Parcela 

Grande 

Parcela 

pequeña 


BLOQUES 


Y -jk 



I 

II 

III 


Bl 

Yin 

Y 121 

Y 3 11 

Y. 11 

Al 


b 2 

y 112 

Y 122 

Y 3 12 

Y. 12 


b 3 

Y 11 3 

Y 12 3 

Y 3 1 3 

Y. 1 3 

Total parcela grande 

Y 11. 

Y 21. 

Y 3 1. 

Yl.. 


Bl 

Y 211 

Y 221 

Y 2 3 1 

Y.21 

A 2 


B 2 

Y 212 

Y 222 

Y 2 3 2 

Y.22 


b 3 

Y 21 3 

Y 22 3 

Y 2 33 

y .2 3 

Total parcela grande 

Y 21. 

Y 22. 

Y 2 3 . 

y 2 . . 

Total bloques 

Y . 1 . 

Y. 2. 

y. 3 . 

Y. . 


Tabla adicional: Esta taba es útil para calcular la suma de cuadrados para ambos factores. 


Factor "B" 

Factor 

Ai 

"A" 

A2 

Total 

B, 

Yi.i 

Y 2 ,i 

Y...i 

b 2 

y L2 

y 2 . 2 

Y. 2 

b 3 

Yl. 3 

Y 2 . 3 

Y ..3 

Total 

Yi„ 

y 2 „ 

Y... 


6.6.3 Tabla para el Análisis de Varianza (Bloques al azar) _ 

Fuente de Grados de Suma de Cuadrados C. medios Valor de 

variación libertad F cale. 
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Bloques 

r - 1 




A 

a- 1 


SCa/GLa 

CM A /CM (a ) 

Error (a) 

(a - 1) (r - 1) 

SC su bt - SCbloque ■ SCa 

SC(a)/GL( a ) 


Subtotal 

ra- 1 




B 

b- 1 

r y 2 y 2 

V a K 

SCb/GLb 

CM B /GL(b) 



ab arb 



AB 

(a - 1) (b - 1) 

a v 2 y 2 

É ' 

rb arb 

scab/glab 

CMAB/CM ( b) 

Error (b) 

a (b - 1) (r -1) 

SCtot - Sc su bt - SC B - SCab 

SC(b)/GL(b) 


Total 

abr- 1 

r a Y 2 V -2 

E E " - 

“í b arb 




y 1 ... 

ar arb 

6.7 Prueba de Tukey o SNK 

En la siguiente tabla se ¡ydicpn S.quc líten tele varj^eión hay que efectuarle dicha prueba 
en relación a su significancia, “f ^ r arb ' 


Fuente de Resultado de la Prueba 

Variación 


A 

* 

NS * NS 

r a b V 2 

X - ' X - ' x^ ° ^ 

NS 

* 

* 

NS 

B 

* 

* L EL L Y a * NS 

7=1 Í=1 k=\ Cllü 

* 

NS 

* 

NS 

AB 

* 

* * * 

NS 

NS 

NS 

NS 
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A quién 
hacerle 
prueba 


AB AB AB 

- W=i ab *Sx 


AB 


B A A; B 


* : Significativo 

NS : No significativo 

(b -1) CM ( b) t b + CM(a) t a \(b-\) CM(b) + CM(a ) 

[ - \ y — _ 

ab (b - 1) CM (b) + CM (a) ' A| rb 

6.7.1 Prueba de Tukey para el factor de la Parcela Grande 


6.7.2 Prueba de Tukey para el factor de la parcela pequeña 


6.7.3 PrueWa délfukey par&la interacción^'A 


¡CM (a) 
rb 


6.7.3.1 Comparación de tratamientos dentro de una misma parcela grande. 


W = <l(h, g m,a) * Sx 


Sx = 


CMjb) 

rb 


6.7.3.2 Comparación de tratamientos entre parcelas grandes diferentes. 

, donde, 


^ — ^(ab.gUbra) 
ta = gl (a), a 


*Sx 


Sx = 



tb = gi(b), a (Valores de tabla de “t” de Student -2 colas-) 
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6.8 Ejemplo de Aplicación 


En un experimento se probaron dos métodos de siembra y tres variedades de arroz. Por 
razones de facilidad en el manejo del mismo, se decidió utilizar un arreglo en parcelas divididas, 
en donde las parcelas grandes correspondieron a los métodos de siembra y en las parcelas 
pequeñas se sembraron las tres variedades de arroz. Los tratamientos se distribuyeron mediante 
un diseño en bloques completos al azar con 4 repeticiones. La variable de respuesta fué kg/parcela 
de 72 m^. A continuación se detallan los factores evaluados. 

Métodos de siembra: S: Secano I: Inundación 

Variedades: BB: Blue Bonnett BP: Belle Patna CR: Criolla 

Cuadro 5: Rendimiento de arroz en kg/parcela de 72 , al comparar distintos 

métodos de siembra en diferentes variedades de arroz. 


Métodos 

de siembra 

Variedades 

Bloques 






I 

II 

III 

IV 


BB 

8.5 

8.2 

8.0 

7.6 

S 


BP 

8.0 

7.0 

7.3 

6.9 


CR 

10.0 

10.8 

11.0 

11.6 


BB 

5.8 

5.6 

5.2 

5.8 

I 


BP 

7.0 

7.1 

7.3 

7.3 


CR 

8.3 

8.0 

8.0 

8.7 


6.8.1 Programa de SAS 


A continuación se presenta el programa SAS y la salida que considera el análisis de varianza con 
arreglo en parcelas divididas. 

OPTIONS NODATE; 

DATA dos; 

INPUT bloque método $ variedad $ rend; 

CARDS; 

1 S BB 8.5 
1 S BP 8.0 
1 S CR 10.0 
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1IBB 5.8 
1 I BP 7.0 

1 ICR8.3 

2 S BB 8.2 


4S CR 11.6 
4IBB 5.8 
4 IBP 7.3 
4 I CR 8.7 

PROC GLM; 

CLASS bloque método variedad; 

MODEL rend=bloque método variedad metodo*variedad bloque*metodo; 
TEST H=metodo E=bloque*metodo; 

LSMEANS metodo*variedad/PDIFF E=bloque*método; 

RUN; 


6.8.2 Salida de SAS 


SAS 

General Linear Models Procedure 
Class Level Information 

Class Levels Val ues 

BLOQUE 4 1234 

METODO 2 I S 

VARI EDAD 3 BB BP CR 


Number of observations in data set = 24 




SAS 





Gener al 

L¡ near Model s 

Procedure 



Dependent 

Variable: REND 







Sum of 

Mean 



Source 

DF 

Squar es 

Squar e 

F Val ue 

Pr > F 

Model 

11 

60. 48833333 

5.49893939 

24. 11 

0.0001 

Error 

12 

2. 73666667 

0.22805556 



Cor r ect ed 

Total 23 

6 3. 2 2 5 00000 





R- Squar e 

C. V. 

Root MSE 


REND Mean 


0.956715 

6. 064148 

0.477552 


7. 8 7 5 00000 



SAS 





Gener al 

Li near Model s 

Procedure 



Dependent 

Variable: REND 





Source 

DF 

Type 1 SS 

Mean Square 

F Val ue 

Pr > F 

BLOQUE 

3 

0. 1 7 5 00000 

0.05833333 

0.26 

0.8558 

METODO 

1 

18.02666667 

18.02666667 

79.05 

0.0001 

VARI EDAD 

2 

34.30750000 

17.15375000 

75. 22 

0.0001 

METODO*VARI EDAD 2 

7. 77583333 

3.88791667 

17. 05 

0.0003 

BLOQUE* METODO 3 

0. 2 0 3 3 3 3 3 3 

0.06777778 

0. 30 

0.8268 

Source 

DF 

Type III SS 

Mean Square 

F Val ue 

Pr > F 

BLOQUE 

3 

0. 1 7 5 00000 

0.05833333 

0.26 

0.8558 

METODO 

1 

18.02666667 

18.02666667 

79.05 

0.0001 

VARI EDAD 

2 

34.30750000 

17.15375000 

75. 22 

0.0001 

METODO*VARI EDAD 2 

7. 77583333 

3.88791667 

17. 05 

0.0003 
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SAS 



Gener al 

Li near Models 

Procedure 



Dependent Variable: 

REND 





Source 

DF 

Type III SS 

Mean Square 

F Val ue 

Pr > F 

BLOQUE* METODO 

3 

0.20333333 

0.06777778 

0.30 

0.8268 

Tests of Hypotheses 

using the 

Type III MS for 

o 

•o 

o 

o 

as an error 

term 

Source 

DF 

Type III SS 

Mean Square 

F Val ue 

Pr > F 

METODO 

1 

18.02666667 

18.02666667 

265.97 

0.0005 


SAS 

General Linear Models Procedure 
Least Squares Means 

Standard Errors and ProbabiI iti es calcul ated using the Type III MS for 
BLOQUE*METODO as an Error term 


METODO 

VARI EDAD 

REND 

LSMEAN 



LSMEAN 

N u mb e r 

1 

BB 

5. 6000000 

1 

1 

BP 

7. 1 7 5 0000 

2 

1 

CR 

8. 2 5 00000 

3 

S 

BB 

8. 0 7 5 0000 

4 

s 

BP 

7. 3000000 

5 

s 

CR 

10. 8500000 

6 


SAS 

General Linear Models Procedure 
Least Squares Means 

Least Squares Means for effect METODO*VARI EDAD 
Pr > | T| HO: L S ME A N ( i ) =L S ME A N (j ) 

Dependent Variabl e: REND 


¡/j 

1 


2 


3 


4 


5 


6 

1 


0 . 

00 34 

0 

0007 

0 . 

0009 

0 . 

002 7 

0 . 

0001 

2 0. 

00 34 



0 

0100 

0 . 

0164 

0 . 

545 8 

0 . 

0003 

3 0. 

0007 

0 . 

0100 



0 . 

4119 

0 . 

0141 

0 . 

0008 

4 0. 

0009 

0 . 

0164 

0 

4119 



0 . 

0245 

0 . 

0006 

5 0. 

002 7 

0 . 

545 8 

0 

0141 

0 . 

0245 



0 . 

0003 

6 0. 

0001 

0 . 

0003 

0 

0008 

0 . 

0006 

0 . 

0003 



To ensure overa 

II pr ot ection 

1 

evel , 

only probab 

i 1 i t 

es 

as s ociated 


pre-planned comparisons should be used. 
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